Skip to main content

Slimshadys's group workspace

Timestamps visible
2023-12-12 08:44:47
PPO Batch Consumption Time: 0,15103
2023-12-12 08:44:47
Total Iteration Time: 7,98094
2023-12-12 08:44:47
Cumulative Model Updates: 2.918
2023-12-12 08:44:47
Cumulative Timesteps: 48.772.718
2023-12-12 08:44:47
Timesteps Collected: 50.018
2023-12-12 08:44:47
--------END ITERATION REPORT--------
2023-12-12 08:44:47
Saving checkpoint 48772718...
2023-12-12 08:44:47
Checkpoint 48772718 saved!
2023-12-12 08:44:55
--------BEGIN ITERATION REPORT--------
2023-12-12 08:44:55
Policy Reward: 35,98290
2023-12-12 08:44:55
Policy Entropy: 0,00129
2023-12-12 08:44:55
Value Function Loss: 0,08285
2023-12-12 08:44:55
Mean KL Divergence: 0,00527
2023-12-12 08:44:55
SB3 Clip Fraction: 0,00244
2023-12-12 08:44:55
Policy Update Magnitude: 0,12628
2023-12-12 08:44:55
Value Function Update Magnitude: 0,27030
2023-12-12 08:44:55
Collected Steps per Second: 8.822,05741
2023-12-12 08:44:55
Overall Steps per Second: 6.658,15747
2023-12-12 08:44:55
Timestep Collection Time: 5,66875
2023-12-12 08:44:55
Timestep Consumption Time: 1,84234
2023-12-12 08:44:55
PPO Batch Consumption Time: 0,15104
2023-12-12 08:44:55
Total Iteration Time: 7,51109
2023-12-12 08:44:55
Cumulative Model Updates: 2.921
2023-12-12 08:44:55
Cumulative Timesteps: 48.822.728
2023-12-12 08:44:55
Timesteps Collected: 50.010
2023-12-12 08:44:55
--------END ITERATION REPORT--------
2023-12-12 08:45:03
--------BEGIN ITERATION REPORT--------
2023-12-12 08:45:03
Policy Reward: 27,47042
2023-12-12 08:45:03
Policy Entropy: 0,00221
2023-12-12 08:45:03
Value Function Loss: 0,08207
2023-12-12 08:45:03
Mean KL Divergence: 0,01386
2023-12-12 08:45:03
SB3 Clip Fraction: 0,00329
2023-12-12 08:45:03
Policy Update Magnitude: 0,07823
2023-12-12 08:45:03
Value Function Update Magnitude: 0,25230
2023-12-12 08:45:03
Collected Steps per Second: 8.213,23108
2023-12-12 08:45:03
Overall Steps per Second: 6.397,25310
2023-12-12 08:45:03
Timestep Collection Time: 6,09212
2023-12-12 08:45:03
Timestep Consumption Time: 1,72936
2023-12-12 08:45:03
PPO Batch Consumption Time: 0,15116
2023-12-12 08:45:03
Total Iteration Time: 7,82148
2023-12-12 08:45:03
Cumulative Model Updates: 2.924
2023-12-12 08:45:03
Cumulative Timesteps: 48.872.764
2023-12-12 08:45:03
Timesteps Collected: 50.036
2023-12-12 08:45:03
--------END ITERATION REPORT--------
2023-12-12 08:45:03
Saving checkpoint 48872764...
2023-12-12 08:45:03
Checkpoint 48872764 saved!
2023-12-12 08:45:11
--------BEGIN ITERATION REPORT--------
2023-12-12 08:45:11
Policy Reward: 27,17206
2023-12-12 08:45:11
Policy Entropy: 0,00267
2023-12-12 08:45:11
Value Function Loss: 0,07982
2023-12-12 08:45:11
Mean KL Divergence: 0,00788
2023-12-12 08:45:11
SB3 Clip Fraction: 0,00187
2023-12-12 08:45:11
Policy Update Magnitude: 0,06413
2023-12-12 08:45:11
Value Function Update Magnitude: 0,23845
2023-12-12 08:45:11
Collected Steps per Second: 7.676,25380
2023-12-12 08:45:11
Overall Steps per Second: 5.985,39589
2023-12-12 08:45:11
Timestep Collection Time: 6,51411
2023-12-12 08:45:11
Timestep Consumption Time: 1,84022
2023-12-12 08:45:11
PPO Batch Consumption Time: 0,14575
2023-12-12 08:45:11
Total Iteration Time: 8,35433
2023-12-12 08:45:11
Cumulative Model Updates: 2.927
2023-12-12 08:45:11
Cumulative Timesteps: 48.922.768
2023-12-12 08:45:11
Timesteps Collected: 50.004
2023-12-12 08:45:11
--------END ITERATION REPORT--------
2023-12-12 08:45:19
--------BEGIN ITERATION REPORT--------
2023-12-12 08:45:19
Policy Reward: 31,56183
2023-12-12 08:45:19
Policy Entropy: 0,00144
2023-12-12 08:45:19
Value Function Loss: 0,06800
2023-12-12 08:45:19
Mean KL Divergence: 0,00060
2023-12-12 08:45:19
SB3 Clip Fraction: 0,00123
2023-12-12 08:45:19
Policy Update Magnitude: 0,05830
2023-12-12 08:45:19
Value Function Update Magnitude: 0,23206
2023-12-12 08:45:19
Collected Steps per Second: 8.298,43251
2023-12-12 08:45:19
Overall Steps per Second: 6.297,03525
2023-12-12 08:45:19
Timestep Collection Time: 6,02837
2023-12-12 08:45:19
Timestep Consumption Time: 1,91601
2023-12-12 08:45:19
PPO Batch Consumption Time: 0,15106
2023-12-12 08:45:19
Total Iteration Time: 7,94437
2023-12-12 08:45:19
Cumulative Model Updates: 2.930
2023-12-12 08:45:19
Cumulative Timesteps: 48.972.794
2023-12-12 08:45:19
Timesteps Collected: 50.026
2023-12-12 08:45:19
--------END ITERATION REPORT--------
2023-12-12 08:45:19
Saving checkpoint 48972794...
2023-12-12 08:45:19
Checkpoint 48972794 saved!
2023-12-12 08:45:27
--------BEGIN ITERATION REPORT--------
2023-12-12 08:45:27
Policy Reward: 34,81264
2023-12-12 08:45:27
Policy Entropy: 0,00164
2023-12-12 08:45:27
Value Function Loss: 0,07488
2023-12-12 08:45:27
Mean KL Divergence: 0,00059
2023-12-12 08:45:27
SB3 Clip Fraction: 0,00102
2023-12-12 08:45:27
Policy Update Magnitude: 0,05715
2023-12-12 08:45:27
Value Function Update Magnitude: 0,24121
2023-12-12 08:45:27
Collected Steps per Second: 8.381,67897
2023-12-12 08:45:27
Overall Steps per Second: 6.493,70167
2023-12-12 08:45:27
Timestep Collection Time: 5,96969
2023-12-12 08:45:27
Timestep Consumption Time: 1,73563
2023-12-12 08:45:27
PPO Batch Consumption Time: 0,14700
2023-12-12 08:45:27
Total Iteration Time: 7,70531
2023-12-12 08:45:27
Cumulative Model Updates: 2.933
2023-12-12 08:45:27
Cumulative Timesteps: 49.022.830
2023-12-12 08:45:27
Timesteps Collected: 50.036
2023-12-12 08:45:27
--------END ITERATION REPORT--------
2023-12-12 08:45:27
Saving checkpoint 49022830...
2023-12-12 08:45:27
Checkpoint 49022830 saved!